Conditional Probability and Bayes’ Theorem

আমাদের খুব পরিচিত একটি এক্সপেরিমেন্ট নিয়ে ভাবা যাক। ধর আমরা একটি ছক্কা রোল করেছি এবং জানতে চাচ্ছি 33 আসার সম্ভাবনা কত (ধরে নাও ছক্কায় যেকোনো সংখ্যা আসার সম্ভাবনা সমান)? উত্তর নিশ্চয়ই 16\frac{1}{6}; এখানে একটি ফেয়ার ছক্কা রোল করা হয়েছে বাদে এক্সপেরিমেন্ট সম্পর্কে কোনো অতিরিক্ত তথ্য ছিল না আমাদের কাছে। কিন্তু কেও যদি আমাদের বলে রোলটিতে একটি বিজোড় সংখ্যা এসেছে, তাহলে কিন্তু 33 আসার সম্ভাবনা 16\frac{1}{6} থেকে বেড়ে 13\frac{1}{3} হয়ে যাবে। অর্থাৎ আমরা যখন এক্সপেরিমেন্ট সম্পর্কে অতিরিক্ত তথ্য পাই তখন কোনো ইভেন্ট ঘটার সম্ভাবনাও পরিবর্তিত হয়ে যায়। যেমন “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা” আর “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা যখন ম্যাচ মিরপুরে হবে” একই কথা নয়- ভেন্যু সম্পর্কে এই অতিরিক্ত তথ্য আমাদের ম্যাচ জিতার সম্ভাবনা বাড়িয়ে দিচ্ছে!

যদি দুটো ইভেন্ট AA এবং BB হয়, তবে "BB ঘটলে AA ঘটার সম্ভাবনা" অর্থাৎ "Probability of AA given BB" কে P(AB)P(A\mid B) দ্বারা প্রকাশ করা হয়। যেমন আগের উদাহরণে A=A = ছক্কায় 33 আসা ও B=B= ছক্কায় বিজোড় সংখ্যা আসা ধরলে P(A)=16,P(B)=12,P(A) = \frac{1}{6}, P(B) = \frac{1}{2}, কিন্তু P(AB)=13P(A\mid B) = \frac{1}{3} । তবে P(AB)P(A\mid B) বের করার কি সহজ কোনো উপায় আছে?

লক্ষ্য কর, AA এবং BB উভয়ই ঘটার সম্ভাবনা, অর্থাৎ P(AB)P(A\cap B), হচ্ছে BB ঘটার সম্ভাবনা, অর্থাৎ P(B)P(B), এবং BB ঘটলে AA ঘটার সম্ভাবনা, অর্থাৎ P(AB)P(A \mid B), এর গুণফল: P(AB)=P(B)×P(AB)P(A \cap B) = P(B) \times P(A \mid B)। কাজেই,
P(AB)=P(AB)P(B)P(A\mid B)= \frac{P(A\cap B)}{P(B)}
এটি অন্যভাবেও ভাবতে পারো, মনে কর sample space Ω\Omega একটি 11 ক্ষেত্রফল বিশিষ্ট একটি চতুর্ভুজ। তাহলে P(A)P(A) আর P(B)P(B) হচ্ছে যথাক্রমে AA আর BB বৃত্তটির ক্ষেত্রফল।

কিন্তু যখন বলে দেয়া হয় BB ঘটে গিয়েছে, তার মানে আসলে BB বৃত্তটির বাইরের সব কিছু irrelevent। অর্থাৎ আমাদের নতুন sample space ই BB, তাই এখন AA ঘটার সম্ভাবনা শুধু (AB)(A\cap B) অংশটি। তাই BB ঘটার পর AA ঘটার সম্ভাবনা হবে (AB)(A\cap B) অংশটি BB বৃত্তের ক্ষেত্রফলের যত ভাগ ঠিক তত! কাজেই আমরা পাচ্ছি P(AB)=P(AB)P(B)P(A\mid B) = \frac{P(A\cap B)}{P(B)}.
আবার একই ভাবে, AABB উভয়েরই ঘটার সম্ভাবনা, অর্থাৎ P(AB)P(A\cap B), AA ঘটার সম্ভাবনা P(A)P(A) এবং AA ঘটলে BB ঘটার সম্ভাবনা, অর্থাৎ P(BA)P(B\mid A), এর গুণফলের সমান! কাজেই P(AB)=P(A)×P(BA)P(A\cap B) = P(A) \times P(B \mid A). তাহলে আমরা লিখতে পারি,
P(AB)=P(A)×P(BA)P(B)P(A\mid B) = \frac{P(A) \times P(B\mid A)}{P(B)}
এটি ই Bayes’ Theorem! এখানে P(A)P(A) কে বলা হয় “prior probability”, P(AB)P(A\mid B) কে বলা হয় “posterior probability” এবং P(BA)P(B)\frac{P(B\mid A)}{P(B)} হচ্ছে “likelihood ratio”.

Some counterintuitive (and super interesting) problems

Problem 1.1. এক ব্যাক্তির দুই সন্তান, যার একটি ছেলে। উনার দুই সন্তান ই ছেলে হওয়ার সম্ভাবনা কত? (কোনো সন্তান ছেলে বা মেয়ে হওয়ার সম্ভাবনা সমান ধরে নাও)


শুরুতে মনে হতে পারে আমরা জানি এক সন্তান ছেলে, তাহলে অপর সন্তানও যেহেতু ছেলে বা মেয়ে হতে পারে, আর উভয় ক্ষেত্রেই সম্ভাবনা সমান, তাই অপর সন্তান ছেলে হওয়ার সম্ভাবনাও 12\frac{1}{2}, কিন্তু তা সত্য নয়। দুটো ইভেন্ট ডিফাইন করা যাক-
A=উভয় সন্তান ছেলেB=সর্বনিম্ন একটি সন্তান ছেলে\begin{align*} A& = \text{উভয় সন্তান ছেলে} \\ B &= \text{সর্বনিম্ন একটি সন্তান ছেলে} \end{align*}
আমাদের দরকার P(AB)P(A\mid B)। লক্ষ্য কর P(A)=14P(A)=\frac{1}{4}, P(B)=34P(B)=\frac{3}{4} (কারণ BB ঘটবে না শুধু যখন উভয় সন্তান ই মেয়ে হবে, যার সম্ভাবনা 14\frac{1}{4}), আর P(BA)=1P(B\mid A)=1 (কারণ AA ঘটলে BB সবসময় সত্য)। কাজেই P(AB)=P(A)×P(BA)P(B)=14×134=13P(A \mid B) = \frac{P(A) \times P(B\mid A)}{P(B)} = \frac{\frac{1}{4}\times 1}{\frac{3}{4}} = \frac{1}{3}

এটি আসলে আমরা এত কিছু না করে sample space এর দিকে তাকালেই পারতাম। লক্ষ্য কর, একজন সন্তান ছেলে হয়ে গেলে আমাদের sample space থেকে উভয় সন্তান মেয়ে ইভেন্টটি বাদ পরে যাচ্ছে, ফলে তা দ্বারাচ্ছে Ω={BB,BG,GB}\Omega = \{ BB, BG, GB\}। ফলে BBBB ঘটার সম্ভাবনা থাকছে 13\frac{1}{3}

Problem 1.2. এক ব্যাক্তির দুই সন্তান, যার একটি ছেলে এবং সে শুক্রবারে জন্মেছিলো। উনার দুই সন্তানই ছেলে হওয়ার সম্ভাবনা কত?


সমস্যাটা দেখেই মনে হতে পারে এর সাথে আগের সমস্যার কোনো পার্থক্য নেই, তাহলে নিশ্চয়ই উত্তর ও আগের মত 13\frac{1}{3}, কেনোনা সন্তান সপ্তাহের কোন দিন জন্মেছে তাতে কিছু যায় আসার কথা না। কিন্তু তা সত্য নয়, মজার ব্যাপার হচ্ছে এবার উত্তর 13\frac{1}{3} থেকে অনেক বেশি! আবার আগের মতো ইভেন্ট ডিফাইন করা যাক-
A=উভয় সন্তান ছেলেB=একটি সন্তান ছেলে যার জন্ম শুক্রবারে\begin{align*} A& = \text{উভয় সন্তান ছেলে} \\ B &= \text{একটি সন্তান ছেলে যার জন্ম শুক্রবারে} \end{align*}
সবার আগে লক্ষ্য করতে পারো এবার কিন্তু আগের মতো P(BA)P(B\mid A) এর মান 11 নয়, কেনোনা উভয় সন্তান ছেলে হলেও এর মধ্যে একজনের জন্ম শুক্রবারে তা নিশ্চিত করা যায় না। আমরা প্রতি সন্তানকে সে ছেলে নাকি মেয়ে আর সে সপ্তাহের কোন দিন জন্মেছে তার ভিত্তিতে একটি পেয়ার হিসেবে প্রকাশ করতে পারি। এরকম পেয়ার থাকতে পারে (2×7)2=196(2 \times 7)^2 = 196 টি। কাজেই এবার sample space এর সাইজ Ω=196|\Omega| = 196। আবার উভয় সন্তান ছেলে হলে তারা সপ্তাহের কোন দিন জন্মেছে তা নির্বাচন করার উপায় থাকে 7×7=497\times7=49 টা, কাজেই P(A)=49196=14P(A) = \frac{49}{196}=\frac{1}{4}P(BA)P(B\mid A) বের করতে আমরা এর কমপ্লিমেন্ট, অর্থাৎ P(BcA)P(B^c\mid A) বের করে 11 থেকে বিয়োগ করে দিতে পারি; P(BcA)P(B^c\mid A) মানে হচ্ছে দুই ছেলের কেওই শুক্রবারে জন্মায় নি, তাহলে আমাদের হাতে দিন বাকি থাকল 66টি, কাজেই P(BcA)=6×649=3649P(B^c\mid A) = \frac{6\times 6}{49} = \frac{36}{49}, কাজেই P(BA)=(13649)=1349P(B\mid A) = (1 - \frac{36}{49}) = \frac{13}{49}। একই ভাবে P(B)P(B) থেকে P(Bc)P(B^c) বের করা সহজ: যেহেতু BcB^c মানে কোনো ছেলে সন্তান শুক্রবারে জন্মাতে পারবে না, তাই সন্তান ছেলে নাকি মেয়ে আর সপ্তাহের কোন দিন জন্মালো এই পেয়ার নির্বাচন করার উপায় থাকলো (2×71)=13(2 \times 7 - 1) = 13 টি, কাজেই P(BcA)=13×13196=169196P(B^c\mid A) = \frac{13 \times 13}{196} = \frac{169}{196}। সুতরাং P(B)=(1169196)=27196P(B) = (1 - \frac{169}{196}) = \frac{27}{196}. কাজেই P(AB)=P(A)×P(BA)P(B)=14×134927196=1327P(A\mid B) = \frac{P(A)\times P(B\mid A)}{P(B)} = \frac{\frac{1}{4} \times \frac{13}{49}}{\frac{27}{196}}=\frac{13}{27}, যা 12\frac{1}{2} এর খুব কাছাকাছি!

Problem 2. (Bertrand’s Box Paradox) তোমার সামনে 33টি বক্স আছে, এর মধ্যে একটি বক্সে ২টি গোল্ড কয়েন, আরেকটিতে ২টি সিলভার কয়েন, আর অন্যটিতে 11টি গোল্ড কয়েন আর একটি সিলভার কয়েন আছে। তুমি randomly একটি বক্স নির্বাচন করে তার থেকে randomly একটি কয়েন নিয়ে দেখলে সেটি গোল্ড কয়েন (তুমি অপর কয়েনটি দেখতে পারছো না)। তবে তোমার নির্বাচন করা বক্সটিতে দুটো গোল্ড কয়েন থাকার সম্ভাবনা কত?


তুমি হয়তো ভাববে যেহেতু নির্বাচন করা বক্সটিতে একটি গোল্ড কয়েন আমরা পেয়ে গেছি, তাহলে দুটো সিলভার কয়েনের বক্সটি আমরা চিন্তা থেকে বাদ দিয়ে দিতে পারি, কাজেই দুটো বক্স আছে এবং এর মধ্যে দুটো গোল্ড কয়েনসহ বক্স একটি, তাই উত্তর হবে 12\frac{1}{2}। কিন্তু সেটি ঠিক নয়।
সুবিধার জন্য আমরা দুটো গোল্ডের বক্সকে GGGG, দুটো সিলভার কয়েনের বক্সকে SSSS এবং একটি গোল্ড আর একটি সিলভার কয়েনের বক্সকে GSGS দিয়ে প্রকাশ করি। আর শুরুতে একটি গোল্ড কয়েন আর সিলভার কয়েন পিক করার ইভেন্টকে যথাক্রমে gg আর ss ধরি।

আমরা জানতে চাই P(GGg)P(GG\mid g) এর মান। লক্ষ্য কর P(GG)=13P(GG)=\frac{1}{3} এবং P(gGG)=1P(g \mid GG)= 1, কেনোনা গোল্ড কয়েনের বক্স নির্বাচন করলে সবসময়ই আমরা গোল্ড কয়েন পাবো। P(g)P(g) বের করতে আমরা 33 টা কেসে ভাগ করতে পারি: শুরুতে GGGG নির্বাচন করলে (যার সম্ভাবনা 13\frac{1}{3}) সবসময় একটি গোল্ড কয়েন পাবো (অর্থাৎ সম্ভাবনা 11), আর SSSS নির্বাচন করলে (যার সম্ভাবনা 13\frac{1}{3}) গোল্ড কয়েন পাওয়ার সম্ভাবনা 00, আর GSGS নির্বাচন করলে (যার সম্ভাবনা 13\frac{1}{3}) গোল্ড কয়েন পাওয়ার সম্ভাবনা 12\frac{1}{2}, কাজেই P(g)=13×1+13×0+13×12=12P(g) = \frac{1}{3} \times 1 + \frac{1}{3} \times 0 + \frac{1}{3} \times \frac{1}{2} =\frac{1}{2}। কাজেই,
P(GGg)=P(GG)×P(gGG)P(g)=13×112=23P(GG\mid g) = \frac{P(GG)\times P(g\mid GG)}{P(g)}=\frac{\frac{1}{3}\times 1}{\frac{1}{2}}=\frac{2}{3}
কাজেই তোমার নির্বাচন করা বক্সে দুটো কয়েনই গোল্ড হওয়ার সম্ভাবনা 23\frac{2}{3}। এটি এভাবেও ভাবতে পারো- একটি কয়েন গোল্ড পাওয়া মানে সেটি দুটো গোল্ড কয়েনের বক্সের যেকোনো একটি হতে পারে (এখানে ২টি অপশন), কিংবা একটি সিলভার ও একটি গোল্ড কয়েনের বক্সের গোল্ড কয়েনটি হতে পারে (এখানে ১টি অপশন)। আর যেহেতু শুরুতে এর যেকোনো একটি কয়েন নির্বাচন করার সম্ভাবনা সমান, আর এই তিন ক্ষেত্রের দুই ক্ষেত্রেই আমরা দুটো গোল্ড কয়েনের বক্স নির্বাচন করছি, তাই এর সম্ভাবনা 23\frac{2}{3}

Problem 3. (The Medical Test Paradox) তোমার দেশে একটি নতুন রোগের আবির্ভাব ঘটেছে, যেটি গড়ে প্রতি 10001000 জনে 11 জনের হচ্ছে। এই রোগটি নির্নয়ের জন্য যে টেস্ট করা হয়, সেটি 99%99\% সময় সঠিক ভাবে নির্নয় করতে পারে। অর্থাৎ যদি কারো সত্যিই রোগটি হয়ে থাকে, তাহলে এই টেস্ট গড়ে 99%99\% সময়ই positive রিপোর্ট দেয়, এবং বাকি 1%1\% সময় false positive রিপোর্ট দেয় তুমি রোগটির জন্য টেস্ট করিয়ে দেখলে রিপোর্ট positive, তবে তোমার সত্যিই রোগটি হওয়ার সম্ভাবনা কত? (ধরে নাও তোমার কাছে টেস্টটির রিপোর্ট বাদে রোগ সংক্রান্ত কোনো তথ্য নেই, এবং এই রোগের কোনো symptom ও হয় না)


এটি Conditional Probability এর আমার খুব পছন্দের সমস্যা। সমস্যাটা দেখে শুরুতেই intuition বলে যেহেতু টেস্টটি 99%99\% accurate, তাহলে নিশ্চয়ই তোমার রোগটি সত্যিই হওয়ার সম্ভাবনা 99%99\% (after all, false positive রেট মাত্র 1%1\%!)। কিন্তু সেটা সত্য নয়! শুরুতে কিছু event ডিফাইন করা যাক-
A=You are sickB=Test report says you are sick\begin{align*} A& = \text{You are sick} \\ B &= \text{Test report says you are sick} \end{align*}
যদি আমাদের কাছে কোনো prior ইনফর্মেশন (এক্ষেত্রে টেস্ট রিপোর্ট) না থাকে, তাহলে তোমার রোগ হওয়ার সম্ভাবনা P(A)P(A) কত? যেহেতু রোগটি গড়ে 10001000 জনে একজনের হচ্ছে, তাই বলতে পারি prior ইনফর্মেশন ছাড়া P(A)=11000P(A) = \frac{1}{1000}। টেস্ট রিপোর্টের accuracy (উপরে যেভাবে ডিফাইন করা হয়েছে তা অনুযায়ী) 99%99\% থেকে আমরা কী বুঝছি? এটি বলছে “তোমার রোগটি হয়ে থাকলে টেস্টে ধরা পড়ার সম্ভাবনা”, অর্থাৎ “Probability of being tested positive given that you are sick”, কিংবা "Probability of BB given AA" বা P(BA)P(B\mid A) ; কাজেই P(BA)=99100P(B\mid A) = \frac{99}{100}। আর আমরা জানতে চাচ্ছি “Probability of being sick given that the test reports you are sick”, অর্থাৎ P(AB)P(A \mid B)- সেটি কিন্তু 99%99\% নয়!
এবার আমরা যদি P(B)P(B) এর মান জানি তাহলেই Bayes’ Theorem কাজে লাগিয়ে P(AB)P(A\mid B) এর মান বের করে ফেলতে পারবো! টেস্ট রিপোর্ট পজিটিভ আসার সম্ভাবনা P(B)P(B) কে আমরা আসলে দুটি আলাদা কেসে ভাগ করতে পারি-

  1. টেস্টকারীর রোগটি হয়েছে: রোগ হওয়ার সম্ভাবনা P(A)P(A) এবং রোগ হলে টেস্ট পজিটিভ আসার সম্ভাবনা P(BA)P(B \mid A); কাজেই উভয়ই ঘটার সম্ভাবনা = P(A)×P(BA)=11000×99100P(A) \times P(B \mid A) = \frac{1}{1000} \times \frac{99}{100}.
  2. টেস্টকারীর রোগটি হয়নি: রোগ না হওয়ার সম্ভাবনা (1P(A))(1- P(A)) এবং রোগ না হলে টেস্ট পজিটিভ আসার সম্ভাবনা, অর্থাৎ False Positive রেট = 1100\frac{1}{100}, কাজেই উভয়ই ঘটার সম্ভাবনা = (1P(A))×1100=9991000×1100.(1 - P(A)) \times \frac{1}{100} = \frac{999}{1000} \times \frac{1}{100}.

কাজেই আমরা পাচ্ছি, P(B)=11000×99100+9991000×1100=1098100000P(B) = \frac{1}{1000} \times \frac{99}{100} + \frac{999}{1000} \times \frac{1}{100} = \frac{1098}{100000}। এবার আমরা P(AB)P(A\mid B) বের করতে পারবো!
P(AB)=P(A)×P(BA)P(B)=11000×991001098100000=111229%P(A\mid B) = \frac{P(A)\times P(B\mid A)}{P(B)} = \frac{\frac{1}{1000} \times \frac{99}{100}}{\frac{1098}{100000}} = \frac{11}{122} \approx 9\%
তারমানে টেস্টে পজিটিভ আসার পর ও রোগ না হওয়ার সম্ভাবনা প্রায় 91%91\%! টেস্টটি এতোটা নিখুঁত হওয়া সত্ত্বেও তোমার রোগটি হওয়ার সম্ভাবনা আসলে খুবই কম! বিষয়টি মেনে নিতে কষ্ট হলে 100,000100,000 জনের একটি sample নিয়ে ভাবতে পার। গড়ে প্রতি হাজারে যেহেতু একজনের রোগটি হচ্ছে, তাই এখানে রোগ হবে 100100 জনের। কিন্তু যেহেতু টেস্টটি 99%99\% নিখুঁত, তাই এতে 9999 জনের টেস্ট পজিটিভ আসবে, আর 11 জনের টেস্ট false নেগেটিভ আসবে। আবার যেহেতু টেস্টের false positive রেট 1%1\%, তাই বাকি (100,000100)×1%=999(100,000 -100) \times 1\% = 999 জন মানুষ false positive পাবে! কাজেই টেস্টে পজিটিভ রিপোর্ট পাওয়া মোট মানুষের সংখ্যা দ্বারাচ্ছে (99+999)=1098(99+999) = 1098 জন, আর এর মধ্যে রোগাক্রান্ত মাত্র 9999 জন! কাজেই তোমার রোগ হওয়ার সম্ভাবনা মাত্র 991098=0.0902\frac{99}{1098} = 0.0902, যা অনেক কম!

Problem 4. (The Monty Hall Problem) তুমি একটি game show তে আছো, তোমার সামনে তিনটি দরজা আছে। দরজা তিনটির একটির পিছনে রয়েছে গাড়ি, আর বাকি দুটির পিছনে রয়েছে একটি করে ছাগল। হোস্ট আগে থেকে জানে কোন দরজার পিছনে কি রয়েছে। তুমি প্রথমে একটি দরজা নির্বাচন করলে; হোস্ট যেহেতু জানে কোন দরজার পিছনে কি আছে, সে একটি দরজা খুলে দেখালো যার পিছনে ছাগল আছে। তারপর সে তোমাকে জিজ্ঞাসা করল এবার বাকি দুটো দরজার মধ্যে তুমি প্রথমে যেই দরজা নির্বাচন করেছ সেটি ই রাখতে চাও, নাকি switch করে অপর দরজাটা নির্বাচন করতে চাও। কি করলে তোমার গাড়ি জিতার সম্ভাবনা বেশি হবে?


তুমি নিশ্চয়ই ভাবছো যেহেতু হোস্ট একটি দরজা খুলে দিয়েছে যার পিছনে ছাগল ছিল, তাহলে বাকি দুটো দরজার একটির পিছনে গাড়ি আর অন্যটির পিছনে ছাগল থাকায় তুমি প্রথমে যেই দরজা নির্বাচন করেছো তার পিছনে গাড়ি থাকার সম্ভাবনা 12\frac{1}{2} এবং অন্যটির পিছনেও গাড়ি থাকার সম্ভাবনা 12\frac{1}{2}, কাজেই শুরুতে যেটি নির্বাচন করেছো সেটিতে থাকা কিংবা দরজা পরিবর্তন করা উভয় ক্ষেত্রেই জিতার সম্ভাবনা সমান হওয়া উচিত। কিন্তু সেটা সত্য নয়, তুমি সুইচ করে যদি অন্য দরজাটি নির্বাচন কর তাহলে তোমার গাড়ি জিতার সম্ভাবনা দ্বিগুণ হয়ে যাবে!

তুমি শুরুতে যেই দরজাটি নির্বাচন করেছো সেটির পিছনে গাড়ি থাকার সম্ভাবনা 13\frac{1}{3}, এবং বাকি দুটো দরজার যেকোনো একটির পিছনে গাড়ি থাকার সম্ভাবনা 23\frac{2}{3}। এখন লক্ষ্য কর, হোস্ট কিন্তু আগে থেকে জানে কোন দরজার পিছনে কি আছে, তাই সে ইচ্ছা করেই এমন দরজা খুলবে যার পিছনে ছাগল আছে। তুমি যদি প্রথমে ভুল দরজা নির্বাচন করে থাক (যার সম্ভাবনা 23\frac{2}{3}), আর বাকি দুটো দরজাকে XX আর YY দিয়ে মার্ক করলে, হোস্ট কিন্তু XX দরজা খুলবে যদি YY এর পিছনে গাড়ি থাকে, আর YY দরজা খুলবে যদি XX এর পিছনে গাড়ি থাকে। কাজেই তুমি যদি সুইচ না করে শুরুর দরজাই নির্বাচন কর, তাহলে তুমি তখন ই জিতবে যখন তুমি শুরুতেই সঠিক ভাবে বের করতে পারবে কোন দরজার পিছনে গাড়ি রয়েছে, যার সম্ভাবনা 13\frac{1}{3}, আর তুমি যদি শুরুতে ভুল দরজা নির্বাচন করে থাক, যার সম্ভাবনা 23\frac{2}{3}, সেসকল ক্ষেত্রে কিন্তু সুইচ করলে তুমি জিতে যাচ্ছ! কাজেই যেহেতু শুরুতে ভুল করার সম্ভাবনা বেশি, তাই সুইচ করলেই তোমার জিতার সম্ভাবনা বেশি (13\frac{1}{3} থেকে বেড়ে 23\frac{2}{3})!

এখনো মেনে নিতে কষ্ট হলে ধরে নাও তোমার সামনে তিনটার বদলে 100100টি দরজা আছে, আর 9999টার পিছনে ছাগল এবং একটির পিছনে গাড়ি আছে। তুমি একটি দরজা নির্বাচন করবে, আর হোস্ট বাকি 9999 টি থেকে 9898টি দরজা খুলে দেখাবে যার পিছনে ছাগল আছে। এবার ফিল করা সহজ যে সবসময় আমাদের সুইচ করা উচিত। কেনোনা 100100 টি দরজা থেকে শুরুতে ঠিকঠাক যে দরজার পিছনে গাড়ি আছে তা খুঁজে বের করার সম্ভাবনা অনেক কম, মাত্র 1100\frac{1}{100}, অন্যদিকে বাকি 9999টির মধ্যে একটিতে গাড়ি থাকার সম্ভাবনা অনেক বেশি (99100\frac{99}{100})। হোস্ট যখন সেই 9999 টার মধ্যের কোন 9898টি দরজার পিছনে ছাগল আছে তা বলে দিচ্ছে, এতে করে তোমার শুরুতে সঠিকভাবে নির্বাচন করার সম্ভাবনা বেড়ে যাচ্ছে না, বরং বাকি যেই 9999টা দরজা ছিল তার মধ্যে একটিতে গাড়ি থাকার সম্ভাবনার পুরোটাই একটি দরজার মধ্যে পুঞ্জিভূত তা বুঝা যাচ্ছে!